期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于音节时间长度高斯拟合的汉语音节切分方法
张扬, 赵晓群, 王缔罡
计算机应用    2016, 36 (5): 1410-1414.   DOI: 10.11772/j.issn.1001-9081.2016.05.1410
摘要676)      PDF (957KB)(349)    收藏
研究汉语自然语音音节切分方法具有明显现实意义,比较准确的自然语音切分方法可以代替人工对一些拥有参照文本的语音进行标注。然而至今为止并没有完全准确的汉语语音音节切分方法。依据相同发音环境下汉语语音音节时间长度服从某种高斯分布和相邻语音音节之间存在短时能量波谷两个假设,提出了基于音节时间长度高斯拟合的汉语音节切分方法。对算法进行分析,根据初步切分短时能量波谷分散到各分语音段的特性,提出了简化算法,有效降低了该音节切分方法的时间复杂度。实验结果表明,音节切分准确度(与人工标注切分时间距离平方的均值)达到小数点后3位,在台式机Matlab环境下运算时间均不超过1 s,可以达到应用要求。
参考文献 | 相关文章 | 多维度评价
2. 基于时频二维能量特征的汉语音节切分方法
张扬, 赵晓群, 王缔罡
计算机应用    2016, 36 (11): 3222-3228.   DOI: 10.11772/j.issn.1001-9081.2016.11.3222
摘要609)      PDF (1015KB)(478)    收藏
较准确的语音切分方法可以极大提高语料标注等工作的效率,有助于语音识别等应用中语音与模型的对齐。利用汉语语音在时频二维的能量特征设计了一种新的汉语语音音节切分方法。用传统方法判断静音帧,用相同时间不同频率的二维能量判断清音帧,用不同时间特定频段的0-1二维能量判断浊音帧及有话帧,综合4种判断结果给出音节切分位置。实验结果表明,该方法切分准确度优于基于归并的音节切分自动机(MBSDA)和高斯拟合法,其音节切分误差为0.0297 s,音节切分偏差率为7.93%。
参考文献 | 相关文章 | 多维度评价